روشی کارا برای کاوش مجموعه اقلام پرتکرار در تحلیل داده‌های سبد خرید

نویسندگان

چکیده مقاله:

Discovery of hidden and valuable knowledge from large data warehouses is an important research area and has attracted the attention of many researchers in recent years. Most of Association Rule Mining (ARM) algorithms start by searching for frequent itemsets by scanning the whole database repeatedly and enumerating the occurrences of each candidate itemset. In data mining problems, the size of data is often too large to fit in main memory. However, in some cases such as records of sales of a large supermarket, the probability of a particular item to be present in a transaction is often very low. This is due to the fact that a large number of items are usually available for purchase and also the fact that a small set of items is purchased by a customer in a shopping. In this paper, we make use of these facts to propose an efficient method for mining frequent itemsets. In our approach, the database is scanned just once, and data is encoded into a compressed form and held in a proper data structure in main memory. In each iteration, the time required to measure the frequency of itemsets, is reduced further (i.e., enumerating n-dimensional candidate itemsets is much faster than (n-1)-dimensional itemsets). We evaluate the efficiency of our technique using both synthetic and real-life datasets and compare it with other ARM methods proposed in past research

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

روشی کارا برای کاوش مجموعه اقلام پرتکرار در تحلیل داده های سبد خرید

کشف الگوهای پنهان و ارزشمند از درون حجم وسیعی از داده­های خام، اخیراً توجه بسیاری از محققان را به خود جلب کرده­است. اغلب روشهای کاوش قوانین تداعی در مرحله اول کار خود کلیه اقلام پرتکرار (ساده و ترکیبی) را از بین تمام اقلام موجود در داده­ها جستجو می­کنند که این امر نیازمند به خواندن مکرر کل داده­ها از دیسک است. در مسائل داده­کاوی، حجم پایگاه داده­های تراکنش معمولاً آنقدر زیاد است که قابل بار شدن د...

متن کامل

رتبه‌بندی واحدهای کارا در تحلیل پوششی‌داده‌ها از طریق تضعیف واحد تحت بررسی در مجموعه امکان تولید

This paper presents a model for ranking efficient units by a new approach. In the proposed method, the idea of excluding the unit being scored from the production possibility set is changed to the idea of weakening the unit being scored. We propose a model for ranking efficient DMUs that is more efficient and less problematic than the models based on excluding the under evaluation unit.

متن کامل

ارائه روشی کارا برای دسته‌بندی مسائل چنددسته‌ای با رویکرد انتخاب دسته‌بند

سیستمهای دسته‌بندی شورایی، رویکردی مؤثر در یادگیری ماشین است که در آن با ترکیب نتایج چند دسته‌بند سعی می‌شود تقریب بهتری از یک دسته‌بند بهینه فراهم شود. در حوزه ترکیب خروجی شورای دستهبندها، رویکرد «انتخاب دستهبند» توجه کمتری را در مقایسه با رویکرد «ادغام دسته‌بند» به خود جلب کرده است. همچنین، اغلب روشهای موجود در این حوزه، هزینه محاسباتی بالایی دارند. در این مقاله، روشی مؤثر در دسته بندی مسائل ...

متن کامل

تحلیل گفتمانی؛ روشی برای تحلیل بازتاب انقلاب‌ها

انقلاب‌ها علاوه بر بعد ملی و سرزمینی دارای بازتاب‌های فراملی و جهانی هستند. نظریه‌پردازی در  مورد این بعد از انقلاب‌ها به‌طور عام و در مورد انقلاب اسلامی ایران به‌طور خاص کمتر مورد توجه بوده است. این مقاله با استفاده از نظریه تحلیل گفتمان لاکلائو وموف در پی توجه به این بعد بوده و در صدد است به این سؤال پاسخ دهد که از منظر تحلیل گفتمان لاکلائو وموف، قابلیت و نحوه بازتاب یافتن یک گفتمان انقلابی ه...

متن کامل

روشی کارا برای پیش بینی ریزش مشتری

با توجه به اشباع شدن بازارها و افزایش رقابت کسب و کارها، امروزه هزینه ی جذب یک مشتری جدید به مراتب بیشتر از حفظ یک مشتری موجود است. بنابراین اهمیت مدیریت ریزش مشتری روز به روز برای کسب و کارها بیش تر می گردد. از طرفی با ظهور تکنولوژی داده کاوی و پیشرفت سریع آن، و همچنین با افزایش اطلاعات ذخیره شده در سازمان ها در ارتباط با مشتریان، کسب و کارها متمایل به استفاده از این تکنولوژی برای استخراج دانش...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 19  شماره 7

صفحات  65- 74

تاریخ انتشار 2009-01

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023